计算机视觉中的深度学习专题(2020) |《中国科学:信息科学》英文版
Progressive rectification network for irregular text recognition
Yunze GAO, Yingying CHEN*, Jinqiao WANG & Hanqing LU
Ordinal distribution regression for gait-based age estimation
Haiping ZHU, Yuheng ZHANG, Guohao LI, Junping ZHANG* & Hongming SHAN
FACLSTM: ConvLSTM with focused attention for scene text recognition
Qingqing WANG, Ye HUANG, Wenjing JIA, Xiangjian HE, Michael BLUMENSTEIN, Shujing LYU & Yue LU*
提出了一种命名为ConvLSTM文本识别模型, 能够从二维空间直接识别场景文本. 在此基础之上, 该方法引入了注意力机制和字符中心位置来进一步对文本识别精度进行了提升.
CGNet: cross-guidance network for semantic segmentation
Zhijie ZHANG & Yanwei PANG*
提出了一个新的网络框架CGNet, 能够同时进行语义分割、边缘检测和显著性检测三种视觉任务. 在边缘检测与显著性检测子网络的引导下, CGNet的语义分割性能能获得显著提升.
05SynthText3D: synthesizing scene text images from 3D virtual worlds
Minghui LIAO, Boyu SONG, Shangbang LONG, Minghang HE, Cong YAO & Xiang BAI*
提出了一种通过三维虚拟世界产生场景文本图像的特别思路. 通过三维虚拟环境产生的文本图像数据具有理想的视觉效果, 涵盖了透视变换、光照与遮挡等多种变化, 可用于训练更鲁棒的文本检测模型.
06Preserving details in semantics-aware context for scene parsing
Shuai MA, Yanwei PANG*, Jing PAN & Ling SHAO
通过嵌入丰富低层语义信息来改进语义分割网络的空间解码过程. 该方法能够更精确地获取语义分割所需要的细节特征.
您可能还感兴趣: